『重み』と重み付き平均の理解
一般的に、$n$ 個の数 $x_1, x_2, \cdots, x_n$ にそれぞれ重み $w_1, w_2, \cdots, w_n$ が与えられている場合、
$\frac{x_1w_1+x_2w_2+\cdots+x_nw_n}{w_1+w_2+\cdots+w_n}$
は、この $n$ 個の数の重み付き平均(weighted average)です。重み(weight)とは、データの重要度を表すものです。重みが大きいほど、そのデータは最終的な平均値に強い影響を与えます(物理的な天秤で、より重いおもりが支点を引き寄せることに似ています)。
仮に選手Aが『内容』では非常に高い得点を獲得しているが、『効果』ではやや劣っているとします。『算術平均』を使うと、彼はあらゆる面で平凡な選手Bと同点になる可能性があります。しかし、『内容』に0.5の重み、『効果』に0.2の重みを割り当てれば、選手Aの重み付き得点はその中心的能力の優位性により勝ちます。重み付き平均は、人材選抜における具体的な価値観を真に反映しています。
頻度を重みとして利用:集団データの処理
大規模なデータを統計する際(たとえば『例6 商店の服販売部門』の従業員の月間売上高、または跳水選手の年齢調査など)、同じ値が何度も出現します。このとき、出現回数(頻度)が、その値の重みとして自然に機能します。
また、$n$ 個の数の平均を求める際、$x_1$ が $f_1$ 回、$x_2$ が $f_2$ 回、\cdots、$x_k$ が $f_k$ 回出現する(ここで $f_1+f_2+\cdots+f_k=n$)とすると、この $n$ 個の数の平均数は:
$\bar{x} = \frac{x_1f_1+x_2f_2+\cdots+x_kf_k}{n}$
これは、$k$ 個の数の重み付き平均とも呼ばれ、$f_1, f_2, \cdots, f_k$ はそれぞれ $x_1, x_2, \cdots, x_k$ の重みです。このような方法で計算された月間売上目標は、個別の極端な高売上による影響を排除し、大多数の従業員の実力を真に反映できるため、挑戦的かつ現実的な報奨制度の策定が可能になります。
階級値の賢明な妥協
データがざっくりと異なる区間に分けられる(データのグループ化)とき、個々の具体的な数値は失われます。このとき、あるグループの階級値は、そのグループの両端の数の平均値を指します。たとえば、区間の中点とその区間の頻度を掛け合わせると、古典的な重み付き計算パターンが形成されます:
$\bar{x} = \frac{11 \times 3 + 31 \times 5 + 51 \times 20 + 71 \times 22 + 91 \times 18 + 111 \times 15}{3+5+20+22+18+15}$